2014/08/10

[Data Analytics] 連結厚資料與巨資料

巨資料(Big Data)和物聯網(Internet of Things, IoT)是這兩年最熱門的科技話題,人工智能的發展,伴隨著各式各樣的行動、可穿戴裝置的發展,似乎暗示了一個極度方便,又隱含著一點危險的未來。

我們時常可以聽到推廣 Big Data solution 的企業或組織,宣稱只要有足夠的資料,他們將能夠預測萬事萬物。但是這個美好的未來,有這麼容易達成嗎?

哈佛商業評論在2014年2月出版了一本新書:《頓悟:用人文科學來解決你最棘手的商業問題》(The Moment of Clarity: Using the Human Sciences to Solve Your Toughest Business Problems),點出了一個很基本的問題:我們的確很容易有越來越多的數據,也有很多分析和預測數據的工具,但是這些數據與「人類行為」的具體關連性到底是什麼,卻是沒有簡單的工具可以「一鍵搞定」的。

華爾街日報也專文介紹了這本書:從“大數據”到“厚數據”The Power of 'Thick' Data)。

  • 所謂“大數據”,是指由強大的分析工具進行篩分的龐大數據集。“大數據”可以成為一種出色的工具,幫助企業收集有關我們行為和偏好的新信息,但它無法解釋我們行為背后的原因
  • 事實上,公司過分依賴“大數據”里的數字、圖表和不甚可靠的信息會面臨風險,那就是將自己與消費者日常生活中豐富多彩、但不能量化的內容隔絕。他們會喪失能力,無法想象和憑直覺感知世界和他們的企業可能會如何演變。
  • 假如讓“大數據”代替我們思考,我們通過細致觀察來認識世界的能力就會開始退化,這好比在一座新的城市,如果只靠GPS來導航,你就無緣親身感受和觸摸這座城市。
  • 成功的企業和管理者會設法了解其產品或服務會讓用戶產生什么樣的情緒甚至本能反應,并能根據情況變化適時調整。他們能夠運用我們所說的“厚數據”(Thick Data)

雖然我本人是相信 Strong AI的,但是我也了解目前人工智能技術在應用上的局限性。

目前形形色色的隨身裝置和環境裝置越來越多,各種感應器無孔不入的滲透到我們的生活當中,讓我們生活中的一切脈絡(context)都逐漸的數據化,但是這些數據代表的是怎樣的脈絡,卻是一個還沒有被明確定義的場域。

之前寫過一篇「情境感知應用實作架構」,基本上是回應朋友的問題:「context aware computing 可以幹嘛?」,其實最根本的問題還是回到:「你想要感知什麼情境?」

目前並沒有一個簡單的 turnkey solution 可以「感知所有的情境」,即便是 Google 提供給開發者的「行動辨識」(activity recognition),也只能辨識「靜止」、「行走」、「奔跑」、「騎自行車」、「在交通工具上」這些基於「移動速度」估算出來的狀態,並不能真的完全知道「使用者正在做什麼」。

以醫療為例,很多數據的「脈絡意義」過去都已經在醫學專業裡被定義好了,所以用Big Data 和 IoT 來實踐醫療看護,是現階段發展最快,廠商投入也最多的。

如果想要回答「如何用各種數據描繪人的生活」,我們不得不回到生活的脈絡裡進行深刻的理解,這樣的「厚資料」是過去人文科學擅長的領域,而若能成功的建立「厚資料」和「巨資料」的連結,用資料驅動的方式來創造生活應用才有實現的契機。


沒有留言: